Konstruktion von Featureräumen und Metaverfahren zur Klassifikation von Webdokumenten

نویسندگان

  • Stefan Siersdorfer
  • Sergej Sizov
چکیده

Abstract: Dieses Papier befasst sich mit der automatischen Klassifikation von Webdokumenten in eine vorgegebene Taxonomie. Wir betrachten dabei vektorbasierte Verfahren des maschinellen Lernens am Beispiel von SVM (Support Vector Machines). In diesem Papier beschreiben wir Möglichkeiten zur Generierung von Featurevektoren unter Berücksichtigung der Besonderheiten von Webdokumenten für solche Verfahren. Weiterhin untersuchen wir die Berechnung von Metaresultaten aus den partiellen Klassifikationsergebnissen.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Automatische Tumorerkennung bei unterschiedlichen Organen mittels Berechnung und Klassifikation von Texturmerkmalen

Zusammenfassung. Die vorliegenden Arbeit beschäftigt sich mit der automatischen Klassifikation von zytologischer Proben des Gebährmutterhalses sowie von Sputum. Die Klassifikation der Stichproben wird jeweils auf einem hochdimensionalen Merkmalsvektor, bestehend aus unterschiedlichen TexturMerkmalen durchgeführt. Zur Verbesserung der Klassifikationsleistungen und zur idealen Adaption der Merkma...

متن کامل

Eine Link-Datenbank zur Integration von Virtual Engineering-Daten

Virtual Engineering beschreibt den kollaborativen Prozess der Produktentwicklung in den Phasen der Konstruktion und Simulation/Analyse mit Hilfe von computergestützten Methoden in unterschiedlichen Entwicklungsabteilungen. Dabei entsteht in verschiedenen Entwicklungsbereichen eine Vielzahl von heterogenen, komplex-strukturierten Dokumenten, Produktdaten und Wissen, welche voneinander abhängen. ...

متن کامل

Lernen durch die Rezeption, Konstruktion und Reflektion digitaler Audio- und Videomedien an der Hochschule

Der Beitrag behandelt drei Varianten des Einsatzes von digitalen Audiound Videomedien an der Hochschule: solche, die 1.) als Lehrmedien primär rezeptiv genutzt; die 2.) zur Konstruktion von Lernmedien eingesetzt und 3.) über eine Internetplattform mit anderen Lehrund Lernmedien vernetzt und im Sinne eines Bildungsmediums gemeinsam von Lernenden reflektiert werden. Diese drei Nutzungsszenarien w...

متن کامل

Computergestützte Segmentierung des frakturierten Acetabulums in CT-Aufnahmen mit Hilfe aktiver Konturen zur Klassifikation und Operationsplanung in der Unfallchirurgie

Zusammenfassung. Für Diagnose und Operationsplanung in der Unfallchirurgie ist die computergestützte Segmentierung von zentraler Bedeutung. Hier wird die Anwendung eines auf aktiven Konturen basierenden Algorithmus zur Segmentierung des frakturierten Acetabulums in CT-Aufnahmen beschrieben. Der Algorithmus ergänzt eine Software, die im Rahmen eines Projekts zur CTbasierten Klassifikation von Ac...

متن کامل

Informatik lehren - zeitgemäße Ansätze zur nachhaltigen Qualifikation aller Schülerinnen

Ziel des Beitrags ist die Darstellung von Ergebnissen grundlegender Überlegungen zur Konstruktion und Umsetzung von Informatikcurricula. Die Gestaltungsmöglichkeiten werden auf dem Hintergrund durchgeführter und geplanter Studien untersucht und einer ersten Bewertung unterzogen.

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2003